Self-Consistency Improves Chain of Thought Reasoning in Language Models
we propose a new decoding strategy, self-consistency, to replace the naive greedy decoding used in chain-of-thought prompting.(Abstract)
Self-Consistencyはdecoding戦略
3つの答えを出す(Figure 1)
最頻値を答えとする(多数決。majority vote)
3つでなくてもよい
検算のイメージ
(プロンプティングではなく)結果の扱いの工夫
文章的に正しいが答えが間違っているがある